پیش بینی برهم کنش های پروتئین-پروتئین مبتنی بر ساختار اول با کمک روش های یادگیری ماشین

پایان نامه
چکیده

مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی برهم کنش های پروتئین-پروتئین یک مسئله مهم در بیوانفورماتیک و سیستم های زیستی به حساب می آید. در حقیقت استخراج برهم کنش های میان پروتئین ها برای ساختن شبکه های برهم کنشی پروتئینی ضروری می باشد. این شبکه ها نقش مهمی در شناخت اکثر فرایندهای زیستی دارند. در سال های اخیر، از روش های آزمایشگاهی با توان عملیاتی بالا برای کشف برهم کنش های پروتئین-پروتئین استفاده شده است. اما این روش ها داده های ناقصی را تولید می کنند که دارای داده های مثبت کاذب و منفی کاذب زیادی هستند. از آنجاییکه امروزه به کارگیری علوم مهندسی برای حل مسائل حوزه علوم زیستی و پزشکی به سرعت و با موفقیت رو به افزایش است، بسیاری از محققان علوم کامپیوتر به این سمت گرایش پیدا کرده اند تا بتوانند از روش های مختلف یادگیری ماشین در پیاده سازی سیستم های خودکار هوشمند به منظور دسته بندی پروتئین ها کمک بگیرند. هدف نهایی در ساخت این سیستم ها، نزدیک بودن هر چه بیشتر تصمیم اتخاذ شده توسط ماشین به تصمیم فرد خبره زیست شناس می باشد. از این رو، تکنیک های یادگیری ماشین مختلفی برای افزایش دقت روش های پیش بینی برهم کنش پروتئین-پروتئین بکار رفته اند. این پیش بینی عموماً یک نوع دسته بندی است که از ویژگی های مختلف پروتئین مانند داده های ژنی، ساختاری و نحوه بیان پروتئین ها استفاده می کند. البته بدست آوردن این اطلاعات هزینه زیادی دربر دارد. اطلاعات ساختار اول یا همان توالی پروتئین ها در دسترس می باشد و استفاده از این داده ها بر خلاف سایر داده های پروتئینی نیاز به داشتن دانش اولیه ای از پروتئین ها ندارد، بنابراین ما در کار خود از این داده ها استفاده می کنیم. در این پژوهش ابتدا به بررسی برهم کنش های پروتئین-پروتئین پرداخته و سپس با استفاده از چندین روش مبتنی بر یادگیری ماشین، تلاش کردیم تا برهم کنش های پروتئین-پروتئین را با دقت قابل قبولی پیش بینی کنیم. با استفاده از ماشین بردار پشتیبان در حالت رگرسیون و بهینه سازی پارامترهای آن با روش جستجوی سلسله مراتبی موازی در مکعب مشبک، دقت پیش بینی برهم کنش های پروتئین-پروتئین بر روی مجموعه داده kups در مقایسه با سایر روش ها 3% بهبود داشت. همچنین با استفاده از یک روش ترکیبی از الگوریتم ژنتیک و شبیه سازی التهابی توانستیم همزمان تعداد ویژگی های مجموعه داده را به همراه مقادیر پارامترهای ماشین بردار پشتیبان بهینه کنیم. روش خود را بر روی مجموعه داده های s.cerevisiae و kups اعمال کردیم و توانستیم به ترتیب به 2.8% و 3.8% بهبود در مقایسه با سایر روش های موجود بر روی این مجموعه داده ها برسیم. همچنین به منظور بررسی عمومیت روش و کارایی آن از چندین مجموعه-داده پزشکی از مرجع uci استفاده شده است. کلید واژه: پروتئین، برهم کنش های پروتئین-پروتئین، پیش بینی برهم کنش های پروتئین-پروتئین، روش های محاسباتی، ماشین بردار پشتیبان.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیش بینی عملکرد پروتئین ها مبتنی بر روشهای یادگیری ماشین

با شناسایی کامل دنباله های پروتئینی در برخی از موجودات زنده همچون انسان، دوره جدیدی در علم زیست شناسی و علوم مرتبط آغاز گردید. هدف اصلی در این دوره، شناسایی عملکرد پروتئین های بی-شماری است که دنباله و ساختار آن ها به طور کامل شناسایی شده است، اما از عملکرد قطعی آن ها اطلاعات دقیقی در دسترس نیست. با توجه به نقش وکارکرد حیاتی پروتئین ها در بسیاری از فعالیت های حیاتی موجودات زنده، مطالعه و تعیین ع...

پیش بینی تاخوردگی دامنه پروتئین ها مبتنی بر روش DBSCAN

در این مقاله یک روش طبقه بندی تغییر یافته بر مبنای روش های طبقه بندی بر اساس چگالی برای طبقه بندی تاخوردگی پروتئین ها ارائه شده است که این روش در برابر وجود نویز مقاوم بوده و از سرعت بالایی برخوردار خواهد بود. طبقه بندی پروتئین ها بمنظور پیش بینی عملکرد آنها و شناسایی خواص پروتئین ها یکی از مسائل بزرگ در حوزه طبقه بندی است. با توجه به پیشرفت علم و دستگاه های توالی یابی پروتئین های بسیاری کشف شد...

متن کامل

پیش بینی ساختارهای دوم و سوم پروتئین با کمک روش های یادگیری ماشین

مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی ساختارهای پروتئین از جمله مسائل چالش برانگیزی است که در طی 35 سال گذشته محققان بسیاری در سراسر دنیا در این زمینه تحقیق کرده اند. اکثر ساختار و عملکرد سلول ها توسط پروتئین ها تعیین می شوند. عملکرد یک پروتئین توسط ساختار آن تعیین می شود. اما به دست آوردن و تعیین ساختار پروتئین کاری مشکل می باشد. برای به دست آوردن ساختار پروتئین از روی دنبال...

15 صفحه اول

آنالیز شبکه برهم کنش پروتئین - پروتئین سلول‌های فیبروبلاست انسانی تیمار شده با الکل اتانول

سابقه و هدف: مطالعات انجام شده نشان می‌دهد که اتانول بیان پروتئین‌ها متعددی را در سلول‌های فیبروبلاست تغییر می‌دهد. تعدادی از این پروتئین‌ها  از فاکتورهای مهم در سرطان‌زایی هستند. بنابراین، آنالیز نقش عمل‌کردی و برهم‌کنش این دسته از پروتئین‌ها به منظور شناسایی مکانیسم‌های عمل‌کردی و سرطان‌زایی الکل دارای اهمیت است. مواد و روش‌ها: در این تحقیق با استفاده از نرم‌افزار Cytoscape و الگوریتم‌های وا...

متن کامل

پیش بینی چندزیرواحدی بودن پروتئین به کمک بررسی ساختار اول پروتئین

شکل فعال زیستی بسیاری از پروتئین ها از دو یا تعداد بیشتری زنجیره پلی پپتیدی تشکیل شده است، این تجمعات پروتئینی اولیگومر نامیده می شوند. همچنین زنجیره های منفرد سازنده اولیگومرها مونومر یا زیرواحد نامیده می شوند. پروتئین های چندزیرواحدی می توانند از زیرواحدهای یکسان یا زیرواحدهای غیریکسان تشکیل شده باشند که هموالیگومر یا هتروالیگومر نامیده می شوند. ساختار چهارم پروتئین ها به تعداد و آرایش فضایی ...

پیش بینی برهم کنش های پروتئین-پروتئین با استفاده از توالی پروتئین ها و توالی ژنوم مربوطه

برهم کنش های پروتئین-پروتئین در بسیاری از فرآیندهای سلولی نقش مهمی ایفا می کنند. بنابراین شناسایی، پیش بینی و تحلیل برهم کنش های پروتئین-پروتئین در حوزه زیست مولکولی مهم می باشد. روش های آزمایشگاهی که به این منظور طراحی گردیده اند بسیار پرهزینه، پر زحمت و وقت گیر می باشند. به همین دلیل نیاز به روش های محاسباتی برای بررسی برهم کنش های پروتئین-پروتئین روزانه افزایش می یابد. از این رو، هدف اصلی ا...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023